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【摘要 】 当 使 用 医疗 保险 等 行政 管理 数据 时 ,为 正确 确定 反复 就 医 的 慢性 病 新 发 病 时 点 , 研究 者 尝试 使 用 
洗 脱 期 为 基础 确定 新 发 病例 。 本 文系 统 地 检索 了 在 PubMed. Web of science、Embase、 中 国 知 网 、 维 普 、 
万 方 数据 库 中 从 建 库 至 2022 年 10 月 1 日 发 表 的 所 有 利用 行政 管 i nae ee 患 病 的 相关 文 
献 , 筛选 并 提取 相关 信息 , 总 结 洗 脱 期 时 长 的 确定 方法 。 截 止 2022 年 10 月 ， 共 纳入 26 篇 有 效 文献 ， 
结果 显示 ， 文 献 来 源 主要 集中 在 加 拿 大 、 美 国 、 ee iia 研究 疾病 包括 
糖尿 病 、 肿 瘤 、 精 神 分 裂 等 多 种 慢性 疾病 。 研 究 认 为 ， 设 定 合适 的 洗 脱 期 是 准确 识别 发 病 病例 的 基础 。 目 
前 文献 中 确定 洗 脱 期 的 方法 主要 分 为 三 大 类 ， 包 括 经 验 确 定 法 、 一 致 性 检验 法 和 逆向 生存 函数 法 。 三 种 方 
法 均 有 相应 的 优势 和 局 限 性 ， 方 法 的 选择 、 判 断 标准 和 稳定 性 有 待 进一步 的 探究 。 

【关键 词 】 慢性 疾病 行政 管理 数据 医疗 保险 数据 洗 脱 期 发 病 患 病 
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[Abstract] When using administrative data such as medical insurance, the researchers attempted to identify new cases based on the 
washout period in order to correctly identify the new onset point of chronic diseases with repeated visits. In this paper, all literatures 
on exploring the incidence and illness of chronic diseases using administrative data from PubMed, Web of science, Embase, CNKI, 
VIP and Wanfang databases published from the establishment of the database to October 1, 2022 were systematically searched. 
Relevant information was screened and extracted, and the determination method of washout duration was summarized. As of October 
1, 2022, a total of 26 valid literatures were included. The results showed that the literatures were mainly from Canada, the United States, 
Australia and other countries with complete and abundant administrative data, and the research diseases included diabetes, cancer, 
schizophrenia and other chronic diseases. It is believed that setting an appropriate washout period is the basis for accurate identification 
of cases. At present, the methods for determining washout period in literature mainly fall into three categories, including empirical 
determination method, consistency test method and reverse survival function method. The three methods have corresponding 
advantages and limitations, and the selection, judgment criteria and stability of the methods need to be further explored. 
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背景 

为 了 有 效 预 防 和 控制 糖尿 病 、 肿 瘤 、 慢 性 阻塞 性 肺病 (COPD) 等 多 种 慢性 疾病 ， 我 们 需要 准确 估计 
疾病 的 患 病 和 发 病 率 。 目 前 有 一 些 大 型 队列 、 调 查 研 究 对 疾病 的 患 病 、 发 病 展开 精确 调查 ， 但 这 种 研究 
方式 耗 时 长 、 耗 资 大 。 因 此 ， 考 虑 应 用 医保 等 行政 管理 收集 的 数据 进行 慢性 疾病 流行 病 学 特征 分 析 ， 但 
这 些 数据 往往 只 不 能 提供 病人 从 出 生 到 死亡 全 部 生命 周期 的 医疗 记录 ， 且 慢性 
病 病人 通常 会 反复 就 医 ， 从 这 些 截断 的 重复 记录 中 有 效 识别 出 新 发 病例 有 一 定 难度 。 为 解决 这 一 问题 ， 
究 者 们 一 般 使 用 回顾 期 (look-back period)， 也 叫 洗 脱 期 (washout period) 为 基础 确定 新 发 病例 。 
其 涵义 指 的 是 患者 在 目标 检索 年 份 内 有 某 慢性 病 的 登记 记录 ， 即 为 可 疑 的 发 病 病例 ， 以 检索 年 为 基础 ， 
向 前 回顾 ， 在 限定 的 洗 脱 期 内 没有 该 病 记 录 即 确定 为 新 发 病例 。 洗 脱 期 的 长 短 目前 尚 没有 统一 结论 ””。 
洗 脱 期 太 短 会 造成 发 病 率 的 高 估 ， 太 长 则 会 导致 数据 利用 不 ”。 一 些 研 究 者 认为 不 同 疾病 有 不 同 的 发 展 轨 
迹 和 疾病 特征 “"， 在 使 用 不 同 数据 库 确 定 不 同 疾病 洗 脱 期 时 ， 均 应 采用 合适 的 方法 确定 最 佳 洗 脱 期 时 
长 。 本 次 研究 系统 综述 了 确定 洗 脱 期 时 长 的 方法 ， 以 期 为 中 国 研 究 者 后 续 使 用 行政 管理 数据 限定 慢性 疾 
病 洗 脱 期 ， 正 确 识别 发 病 病例 提供 思路 。 
ly 方法 
1. 1 数据 来 源 及 检索 策略 

研究 检索 了 从 建 库 至 2022 年 10 月 1 日 发 表 的 所 有 相关 文献 .研究 数据 来 源 于 3 个 英文 数据 库 (PubMed、 
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Web of Science, Embase) 和 3 个 中 文 数 据 库 (CNKI、VIP、 万 方 数 据 库 )。 中 文 检索 词 包 括 : 医保 数据 、 
官方 数据 、 行 政 数据 、 医 院 数据 、 患 病 , 发 病 , 洗 脱 期 、 回 顾 期 、 窗 口 期 。 英 文 检 索 词 包括 : administrative 
data, insurance data, hospital data, Medicare, prevalence, incidence, look-back period, wash- 
out time, clearance time, disease-free time, observation time. 
1. 2 纳 排 标准 

纳入 标准 : CL) 研究 数据 为 行政 管理 数据 , 包括 医疗 保险 数据 、 疾 病 登 记 注 册 数 据 、 医 院 记 录 数 据 等 ; 
(2) 研究 疾病 为 慢性 病 ， 同 一 患者 同 种 疾病 出 现 多 次 记录 ; (3) 研究 目的 为 探究 疾病 患 病 、 发 病情 况 ， 聚 
焦 流 行 病 学 特征 ; (4) 研究 中 有 洗 脱 期 的 相关 内 容 。 

排除 标准 :(1) 非 中 英文 数据 (2) 研究 数据 非 官方 数据 , 如 队列 调查 、 病 例 对 照 试验 调查 数据 等 ; (3) 
研究 疾病 非 慢 性 病 ， 如 感染 性 疾病 、 急 性 病 等 ; (4) 研究 目的 为 评估 药物 有 效 性 、 治 疗 模式 、 费 用 负担 等 
非 疾病 流行 病 学 特征 ; (5) 研究 中 未 出 现 洗 脱 期 相关 ; (6) 非 原 始 研究 ， 如 : 评论 、 系 统 综述 等 ; (7) 会 
议 摘要 ; (8) 无 法 获取 原文 。 
1.3 信息 提取 

由 两 名 独立 的 研究 人 员 对 符合 纳入 标准 的 文献 相关 信息 进行 提取 ， 并 对 提取 信息 进行 交叉 核对 ， 以 保 
证 信息 提取 质量 。 提 取信 息 包 括 : (1) 文章 基本 信息 : 文章 名 称 、 第 一 作者 、 发 表 年 份 ; (2) 使 用 数据 库 
基本 信息 : 国家 、 数 据 库 名 称 、 涵 盖 人 和 群 范围 、 数 据 库 截取 年 份 ; 3) 研究 设计 : 研究 疾病 、 最 佳 洗 脱 期 
判断 方法 及 标准 、 采 用 洗 脱 期 时 长 。 
1.4 研究 方法 
使 用 EndnoteX20 建立 数据 库 ， 严 格 依据 纳入 排除 标准 筛选 文献 。 使 用 Draw 软件 绘制 流程 图 ， 使 用 
Microsoft Excel 2010 对 文章 信息 进行 提取 和 基本 特征 分 析 ， 描 述 综 述 洗 脱 期 确定 方法 。 
2， 结 果 
2. 1 文献 筛 检 流 程 及 结果 

本 次 研究 通过 知 网、 万 方 、 维 普 等 数据 库 ， 检 索 出 中 文 文献 21 篇 ;通过 PubMed, Embase, Web of 
Science 检索 相关 英文 文献 1203 篇 。 经 过 初 筛 、 复 和 瀑 ， 筛 选 基于 行政 管理 数据 库 评估 慢性 病 患 病 或 发 病 等 
流行 病 学 特征 的 相关 文献 54 篇 ， 排 除 其 中 28 篇 未 使 用 洗 脱 期 研究 ， 最 终 纳入 26 篇 文献 进入 本 次 系统 综 
述 ， 文 献 具 体 筛 检 流 程 见 图 1。 

纳入 的 26 篇 文献 均 为 英文 文献 ， 研 究 国家 主要 集中 在 加 拿 大 、 美 国 、 澳 大 利 亚 等 ， 研 究 疾病 包括 糖尿 
病 、 肿 瘤 、 精 神 分 裂 等 多 种 慢性 疾病 ， 研 究 目 的 聚焦 于 多 种 慢性 疾病 的 发 病 、 患 病 确 定 。 所 有 纳入 的 研究 
中 ， 多 数 研究 (46. 15%，n=12) 文献 数据 来 源 为 医疗 保险 数据 ，8 篇 为 医院 病人 注册 记录 ， 其 余 文 献 数据 
来 源 包 括 有 居民 健康 项 目 注 册 、 疾 病 调查 项 目 注 册 等 大 型 行政 管理 数据 。 研究 使 用 的 数据 库 年 份 跨 度 较 
长 ， 仅 有 两 篇 文献 数据 包含 年 份 小 于 5 年， 半数 以 上 (53. 85%，n=14) 的 数据 库 年 份 跨度 大 于 10 年 。 纳 入 
文献 及 使 用 数据 库 基 本 信息 见 表 1。 
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鉴 文献 检索 来 源 

= Px: 中 国 知 网 ， 万 方 ， 纵 车 (n=21) 

xe Æx: Pubmed, Embase, Web of sicience (n=1203) 
文献 初 箱 (n=545) 

得 = 

选 文献 复 笨 (n=512) 


相关 文献 (n=54) 


纳入 文献 (n=26) 


图 1. 文献 筛选 流程 图 
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阅读 题目 和 摘要 后 排除 (n=679) : 
1. 重 复 (n=584) 

2 综述 和 meta 分 析 (n=2) 
3. 非 慢性 病 (n=93) 


文献 排除 (n=33); 


文献 排除 (n=458)- 
1. 评 估 疾 病 费 用、 疾病 负担 (n=42) 


4 构建 队列 、 病 例 对 照 研究 (201) 
5 .无 全 文 (n=3) 


没有 使 用 洗 脱 期 (n=28) 


作者 
K. M. Ødegaard 
K. J. Brameld 


N. Beaudet 


S. Asghari 


Alain Vanasse 


E. |. Benchimol, 


J.C.Lin 
Gerhard Sulo 


J. Czwikla 


Rassen, J. A. 


Sascha Abbas 


J. D. Stein 


发 表 年 份 
2022 
2003 


2014 


2009 


2012 


2014 


2014 
2015 


2017 


2019 


2012 


2013 


研究 疾病 


DA 
糖尿 病 、 心 肌 梗死 
THe 


糖尿 病 


精神 分 裂 


慢性 肠 道 疾 病 


糖尿 病 视网膜 病变 
心肌 梗死 
乳腺 癌 、 前 列 腺 
fa. SBA 
慢 阻 肺 、 银 居 病 、 
精神 分 类 、 圳 性 纤 
维 症 
糖尿 病 、 结 直肠 
fa. bA 
青光眼 、 黄 斑 变性 


表 1 文献 及 使 用 数据 库 基本 信息 


国家 /地 区 


= 


IEKE 


at 


ISA 


Ch 


ISA 


加 拿 大 安大略 
省 


中 国 台 湾 
挪威 


德国 黑 森 州 


美国 明尼苏达 


使 用 数据 基本 信息 
名 称 类 型 
The Norwegian Patient Registry 医院 登记 
Patient Registry 医院 登记 
the Régie de l'Assurance Maladie du Qu 
ar OU 医疗 保险 
ebec (RAMQ) 
the Régie de l'Assurance Maladie du Qu 
eee OU 医疗 保险 
ébec(RAMQ) 
the Régie de l'Assurance Maladie 
saa 医疗 保险 
duQue’bec (RAMQ). 
Hospital Discharge Abstract Data 
(DAD), Canadian Institute for Health ”医院 登记 
Information (CIHI-DAD) 
Health Insurance Database of taiwan 医疗 保险 
Norway project 其 他 
Statutory Health Insurance 医疗 保险 
Electronic Health Records 其 他 
Statutory Health Insurance sample (SHI) ”医疗 保险 
The Clinformatics Data Mart database ”医疗 保险 


使 用 年 份 
2008-2018 
1980-1995 


2000-2007 


1992-2002 


1996-2006 


2002-2012 


2005-2011 
1994-2009 


2006-2014 


2011-2014 


2000-2008 


2001-2011 


涵盖 人 和 群 
挪威 全 体 人 群 


SESE 50% 以 上 人 了 群 
5686255 


aber 50% 以 上 人 和 群 


atte SOMME ABE 


A 99% 人 口 


德国 90W% 人 口 


美国 大 部 分 人 群 


总 共 涵盖 2457 人 


M. Rosenlund 


N. Schmedt 


R. Camplain 


C. Ohlmeier 


B. K. Koo 
M. Jurisson 


A. S. Bukhbinder 


L. Zhou 


J = Katzenellenbogen 
Ou.Y 


B. B. Clissold 
J. K. Ahn 


K. K. Anderson 


M.Katzenellenbogen 


2020 


2017 


2017 


2019 


2014 


2014 


2022 


2022 


2019 


2012 


2017 
2020 


2012 


2010 


24 中 慢性 病 
多 发 性 硬化 
DA 


亨廷顿 氏 病 


糖尿 病 、 动 脉 粥 样 
硬化 


血栓 形成 


风湿 性 心脏 病 
青光眼 、 阿 尔 效 海 
AME, HRA 
中 风 
风湿 性 疾病 


精神 分 裂 


心肌 梗死 


澳大利亚 
美国 


维多利亚 
韩国 


加 拿 大 魁北克 


澳大利亚 


National Patient Register 
German Pharmaco epide miological 
Research Database (GePaRD) 
the Atherosclerosis Risk in Communities 
(ARIC) 

Applied Health Research Berlin (InGef) 
Research database 


The National Health Insurance (NHI) 


Estonian Health Insurance Fund 
the Optum Clinformatics Data Mart 
(CDM) 

Canadian Institute for Health 
Information's Discharge Abstract 
Database(CIHI-DAD) 

ARF register data 


Medicare 5% claims data 


Victorian Admitted Episodes Dataset 
National Health Insurance Service 
the Régie de l'Assurance Maladie du Qu 
ébec(RAMQ) 

Hospital Morbidity Data Collection 
(HMDC), Mortality Data Set 


医院 登记 


其 他 


其 他 


其 他 


医疗 保险 
医疗 保险 


医疗 保险 


医院 登记 


医疗 保险 
医疗 保险 


2005-2013 


2004-2013 


2000-2012 


2010-2016 


2007-2011 


2005-2012 


2009-2019 


2011-2017 


2000-2017 


1994-2007 


1997-2008 
2007-2018 


2000-2006 


1980-2004 


7943807 


4175877 


15744 


约 6.7 BAA 


韩国 97% 人 群 


爱沙尼亚 96% 以 上 人 口 


美国 保险 (Medicare) 5% 以 上 人 


口 
4,932,422 


韩国 97% 人 群 


Sib er SOMME ABE 


2. 2 最 佳 洗 脱 期 探究 方法 


综述 研究 发 现 ， 目 前 文献 中 确定 洗 脱 期 的 方法 主要 分 为 三 大 类 ， 包 括 经 验 确 
专家 建议 、 临 床 经 验 、 文 献 检 索 或 受 限 于 数据 获取 年 份 ， 直 


向 生存 曲线 法 。 纳 入 的 研究 


有 12 篇 文献 使 月 


接 确 定 洗 脱 期 ，9 篇 文献 使 月 


2.2.1 一 致 性 比较 法 


日 一 致 性 检验 的 相关 指标 
脱 期 对 发 病 率 估计 的 影响 、 确 定 洗 脱 期 ，3 篇 文献 使 用 逆向 生存 函数 确 


纳入 文献 中 有 9 篇 文献 采 
Values, PPVs), Hamir. BAY 


一 致 性 比较 法 , 比较 指标 包括 Kappa 值 


定 法 、 


定 最 佳 洗 脱 期 。 


预测 值 、 灵 敏 度 、 准 确 度 。 所 有 方法 均 采 


Nee 


， 如 Kappa 值 ， 阳 性 预测 值 (PPV)， 高 估 率 等 评估 洗 


致 性 检验 法 和 逆 


\、 阳 性 预测 值 (Positive Predictive 
数据 可 达到 的 最 长 洗 脱 期 为 


“ 金 标 准 ”， 使 用 以 上 指标 定量 比较 不 同 洗 脱 期 下 确定 的 发 病人 数 (Incident patient defined by 


different clearance period 
criterion，IDG) 的 差异 性 。 其 
章 采 用 Kappa 值 ，3 篇 文章 采 


2.2.2 逆向 生存 函数 法 


，IDD)， 与 “ 金 标准 ”确定 的 


用 


发 病人 数 (Incident patient defined by golden 
中 有 6 篇 文章 采用 过 高 估计 率 (overestimation = (IDD — IDG)/IDG) 2 篇 文 
PPVs, 1 篇 文章 采用 灵敏 度 、 特 异 度 和 阴性 预测 值 为 指标 比较 一 致 性 。 其 
中 仅 有 Kappa 值 提出 了 相关 确定 判断 标准 ， 按 照 Byrt、Shabnan "等 人 提 昌 
1-0 时 , 认为 “没有 一 致 性 ”; AF 0-0. 20 时 , 认为 “一 致 性 不 佳 ”; AF 0. 21-0. 40 时 
介 于 0.41-0.6 时 ,认为 “一 般 一 致 ”; 介 于 0. 61-0. 80 EF, 认为“ 一致 | 
“一 致 性 好 ” IF 0.91-1.0 时 ， 认 为 “一 致 性 极 好 ”。 其 他 指标 均 没 有 确 


方法 ， 当 kappa 值 介 于 - 
h 认为“ 低 一 致 性 ”; 
EEE”; 介 于 0. 81-0. 90 时 ， 认 为 
IT — BPE 


逆向 生存 函数 法 借用 生存 函数 的 思路 ,一般 使 用 Kaplan-Meier 或 寿命 表 法 进行 估计 。 在 该 方法 中 , 终 


点 时 间 为 在 洗 脱 期 内 出 现 重 复 记 录 ， 生 存 被 定义 为 在 给 定 的 洗 有 
被 定义 为 新 发 病例 。 有 具体 来 说 ， 如 计算 j 年 中 茶 慢 性 病 i 的 发 
JÄ i 被 记录 的 日 期 ，b 代表 该 病人 洗 脱 期 内 离 a 最 近 的 一 次 疾病 i 记录 
如 果 该 病人 在 给 定 的 洗 脱 期 内 有 重复 i 


期 内 没有 重复 记录 ， 该 病人 则 被 定义 为 “ 删 失 ” MEF”, A 
计算 在 给 定 洗 脱 期 T 下 ， 研 究 对 象 的 生存 概率 [S(b], 一 般 可 以 使 用 Kaplan-Meier 或 寿命 表 法 进行 估计 , 并 
线 。 同 时 ，Kate J Brameld" 等 和 N，Beaudet" 等 在 文章 中 也 i = 
达到 t 的 个 体 在 接 下 来 的 At 时 间 内 发 生 终点 事件 的 
为 , 存在 某 一 时 点 tf 使 得 h(ty) 趋 近 于 零 , S(ty) 趋 近 于 定 值 , 该 时 点 , 即 为 最 佳 洗 脱 期 。 在 实际 研究 中 
J Brameld 等 认为 当 h(tr) < 0.00001 时 ， 即 为 趋 
Asghari ”等 人 的 研究 则 未 计算 风险 函数 ， 仅 在 生存 函数 不 再 变动 ， 趋 近 于 稳定 时 ， 取 值 最 佳 洗 脱 期 。 


绘制 生存 函数 曲 


义 为 生存 时 间 已 


2.3 洗 脱 期 时 长 


纳入 的 26 i SCHR, ATA 
文献 最 多 (n=10) , 其 次 为 糖尿 病 Cn=4)。 研 究 使 月 


究 的 疾病 包括 糖尿 病 、 


使 用 差异 明显 。 同 时 , 4 
脱 期 时 长 最 长 为 13 年 ， 最 短 为 1 年 。 


发 表 
作者 

年 份 

Sascha Abbas 2012 
J. D. Stein 2013 
M. Rosenlund 2020 
N. Schmedt 2017 
R. Camplain 2017 
K. M. Odegaard, 2022 
Alain Vanasse 2012 


纳入 文献 洗 脱 期 确 


be UB, H 


近 于 0, 而 N. Beaudet 


H 
5] 


ICD 


”等 则 未 给 


者 的 有 


十 算 了 风险 函数 [h(t)]， 其 名 
F 绘 制 风险 函数 曲线 。 研究 认 


1 


Bi 


E 复 记录 ， 即 可 
病人 在 j 年 中 第 一 次 因 疾 
日 期 ， 代表 洗 脱 期 
OR, 该 病人 的 ”生存 时 间 ” 为 2 = a 一 b; 如 果 该 病人 在 给 定 的 洗 脱 
MAA, = a 一 c， 据 此 建立 生存 函数 ， 


日 期 。 


, Kate 


具体 标准 。S. 


F 风 、 精 神 分 裂 等 多 


表 2. 洗 脱 期 确定 方法 及 时 长 


使 用 洗 脱 接 


RRA AED 
j bR 


研究 疾病 期 时 长 R 
(年 ) Æ 
法 
1-8 
青光眼 、 黄 斑 变 性 3-5 
24 中 慢性 病 0.5-9 
多 发 性 硬化 8 
心 衰 0.5-3 
心 衰 1-8 
精神 分 裂 7 


ff S38 BA tt HE ah kek 


中心 
的 洗 脱 期 时 长 从 0. 5 一 15 年 不 等 ,不同 疾 
究 发 现 同一 疾病 的 洗 脱 期 长 短 差异 也 较 大 ，4 篇 研究 糖尿 病 的 文献 中 ， 使 用 的 洗 
定 方法 及 洗 脱 期 时 长 详细 信息 见 表 2。 


具体 指标 


a 


a De MS 


发 病 高 估 率 


发 病 高 估 率 
发 病 高 估 率 
发 病 高 估 率 
发 病 高 估 率 
发 病 高 估 率 
Kappa, PPVs 


E. |. Benchimol, 


N. Beaudet 
S. Asghari 
K. J. Brameld 
L.C.Lin 
C. Ohlmeier 


B. K. Koo 


M. Jurisson 


A. S. Bukhbinder 


L. Zhou 


J.Katzenellenbogen 


Ou, Y 


B. B. Clissold 
J. K. Ahn 
K. K. Anderson 


J.Katzenellenbogen 


Gerhard Sulo 


J. Czwikla 


Rassen, J. A. 


3， 讨 论 


2014 


2014 
2009 
2003 
2014 
2019 


2014 


2014 
2022 
2022 
2019 


2012 


2017 
2020 
2012 
2010 
2015 


2017 


2019 


慢性 肠 道 疾 病 


TEW 
糖尿 病 
糖尿 病 、 心 肌 梗 死 
糖尿 病 视网膜 病变 
Sei Kia 
糖尿 病 、 动 脉 粥 样 
硬化 
Be a dT 
阿尔 北海 默 
血栓 形成 
风湿 性 心脏 病 
青光眼 、 阿 尔 效 海 
Sir, Hee 
中 风 
风湿 性 疾病 
精神 分 裂 
心肌 梗死 
心肌 梗死 
乳腺 癌 、 前 列 腺 
癌 、 结 直肠 癌 
慢 阻 肺 、 银 收 病 、 
精神 分 裂 、 训 性 纤 
维 症 


5 
3 
4-6 
15 


3,5,7,8,10 


1 一 / 


1—4 


V 
V vV 
V 


< <<<. 44 4 4 444 4 4 4 


一 


预测 值 


逆向 生存 函数 、 
逆向 生存 函 
文献 检索 
文献 检索 
文献 检索 
直接 给 定 
直接 给 定 
直接 给 定 
数据 限制 
文献 检索 
文献 检索 
直接 给 定 
直接 给 定 
数据 限制 
直接 给 定 


数据 限制 


数据 限制 


灵敏 度 、 准 确 度 、PPVs、 阴 性 


逆向 生存 函数 、PPVSs、Kappa 


Kappa 
数 


本 次 研究 系统 梳理 了 使 用 行政 管理 数据 库 确定 慢性 疾病 发 病 病 例 , 限定 最 佳 洗 脱 期 时 长 的 方法 。 目 前 ， 


半数 左右 的 下 
有 统一 结论 。 


期 时 长 的 方法 主要 有 三 种 : 


究 Cn 


逆向 生存 | 


息 获 取 不 足 。 部 分 文献 (n=9，34. 62%) 使 上 


| 线 法 用 的 相对 较 少 。 

本 次 研究 发 现 半数 (n=13，50. 00%) 的 看 
献 检索 等 方式 直接 FP 
说 服 力 ， 研 究 者 也 在 文章 局 限 忻 


民 定 洗 脱 期 长 短 。 此 方法 虽 便 提 
中 指出 ， 直 接 限定 的 这 


一 致 性 检验 指标 不 同 ， 
Shabnam "等 人 1993 年 提出 的 分 类 标准 进行 判断 
Kappa 值 大 于 0.8 (分 类 为 “一 致 尾 


(如 糖尿 病 、 心 
eR 7 E 


标准 ，Mats Rosenlund" E AXA 


ZE 
wT) 


后 ， 


据 生存 概率 和 风险 概率 对 最 但 


有 能 获得 的 记录 估计 生存 函数 
集中 趋势 ， 有 效 定量 判断 最 和 


目前 使 月 


管 疾病 ) 发 病 病 


则 选择 准确 度 达到 90% 作 为 评判 标准 “。 仅 有 少 部 分 
用 逆向 生存 函数 确定 最 佳 洗 脱 期 。 在 Kate J Brameld 
该 方法 被 陆续 使 用 "””。 逆 向 生存 函数 法 人 


昌 较 多 的 一 般 为 Kappa 
， 其 余 
ERE”) 作为 选择 标 # 
列 时 ， 高 的 Kappa 
其 他 一 致 性 指标 则 没有 具体 的 定量 限定 标准 ， 如 Sascha 
H 20%; 对 于 PPVs, AA 


REH ERIRE AA E Hb ID 
好， 但 缺乏 量化 的 数据 支持 ， 一 定 程度 
E 脱 期 可 能 会 导致 发 病 估计 不 准确 ”二 ;， 2 篇 文献 选 
择 直 接 使 用 最 长 数据 获得 年 份 为 洗 脱 期 ， 导 致 数据 无 法 有 效 利用 ， 通 常 只 能 评估 一 年 的 发 病情 ， 
一 致 性 检验 的 相关 指标 确定 最 佳 洗 脱 期 。 不 同 的 文献 使 用 的 


E, DIR, 


j 的 洗 脱 期 时 长 从 0. 


值 和 高 估 率 ， 


其 中 Kappa 值 的 判定 标准 采用 
一 致 性 指标 没有 具体 的 判断 依据 。 多 数 研 究 选 择 
EW O 外， 但 有 研究 认为 在 确定 高 患 病 率 的 疾病 


5-15 年 不 等 。 确 


=26, 49.15 %) 在 确定 慢性 疾病 发 病 病例 时 ， 使 用 了 洗 脱 期 ， 但 洗 脱 期 的 时 长 目前 尚 没 
纳入 研究 的 26 篇 文献 ， 涉 及 了 24 种 疾病 ， 采 | 


直接 限定 法 、 一 致 性 比较 法 和 逆向 生存 曲线 法 , 其 中 最 常用 的 还 是 直接 限定 法 ， 


定 洗 脱 


有， 该 方法 利用 专家 建议 、 文 
上 缺乏 


研究 信 


Byrt、 


寺 可 能 与 病例 的 高 患 病人 数 有 关 ， 稳 定性 有 待 进 


Abbas 等 人 采用 


10% 的 高 估 率 


究 选择 80% 为 评判 指标 ”， 


究 (n=3, 11.54%) fi 


3 等 人 于 2003 首次 提 H 


可 以 最 大 限度 利 


数据， 使 用 
环 紊 和 风险 值 的 


生 ， 即 判断 标准 尚未 完全 统 


为 临界 


而 Eric I. Benchimol 
用 生存 函数 的 思路 ， 使 
逆向 生存 函数 法 确定 洗 脱 期 
用 生存 函数 的 思路 ， 绘 制 生存 函数 和 风险 函数 曲线 
洗 脱 期 时 长 进行 确定 。 研 究 者 认为 该 方法 
。 同 时 ， 通 过 风险 函数 和 风险 函数 曲线 可 以 直观 发 现 生存 术 
EE 的 洗 脱 期 时 长 。 但 该 方法 也 存在 一 定 的 局 限 1 


， 并 依 
所 


一 。 如 Kate J Brameld” 等 人 认为 当 风 险 小 于 0. 00001 时 ， 即 达到 最 佳 洗 脱 期 时 长 ， 按 照 此 标准 下 ， 糖 
尿 病 的 洗 脱 期 长 达 13 年 。Asghari"" 等 人 并 未 使 用 这 一 标准 ， 而 是 仅 通过 生存 概率 不 再 变化 这 一 指标 ， 
确认 糖尿 病 的 洗 脱 期 为 5 年， 使 得 同一 疾病 洗 脱 期 时 长 有 较 大 差异 。 值 得 注意 的 是 ， 由 于 洗 脱 期 时 长 确 
定 方 法 尚未 统一 ， 且 判断 标准 也 没有 达成 共识 ， 因 此 许多 研究 者 在 探究 最 佳 洗 脱 期 时 ， 选 择 计算 多 个 一 
致 性 指标 ， 结 合 道行 生存 函数 ， 进 行 综合 判断 ” 。 

在 洗 脱 期 时 长 方面 ， 研 究 纳 入 的 文献 采用 的 洗 脱 期 从 0. 5-15 年 不 等 ， 不 同 疾病 使 用 的 洗 脱 期 时 长 差 
异 较 大 。 有 研究 认为 ， 该 现象 是 由 于 不 同 疾病 有 不 同 的 发 展 轨迹 和 疾病 特征 导致 "。 本 次 研究 同时 发 现 ， 
即使 同一 疾病 ， 如 糖尿 病 ， 洗 脱 期 时 长 差异 也 较 大 。 我 们 认为 ， 造 成 该 差异 的 原因 ， 可 能 是 由 于 数据 的 
可 使 用 年 上限、 人群 就 医 习惯 、 数 据 收集 方式 等 差异 导致 。 因 此 ， 我 们 认为 ， 在 使 用 不 同 数据 库 确 认 不 同 
疾病 的 发 病 病例 时 ， 均 应 选择 合适 的 方法 探索 最 佳 洗 脱 期 ， 并 在 此 基础 上 进行 进一步 疾病 流行 病 学 特征 
的 研究 ， 这 一 观点 也 与 一 些 研究 者 不 谋 而 合 "””。 这 提示 我 们 ， 在 后 续 研究 者 使 用 中 国医 保 、 疾 病 注册 
等 行政 管理 数据 进行 慢性 疾病 的 流行 病 特征 相关 分 析 时 ， 考 虑 医保 政策 、 环 境 人 种 等 差异 存在 ， 不 建议 
直接 应 用 其 他 国家 的 洗 脱 期 ， 应 在 数据 支持 的 情况 下 ， 选 择 合适 的 方法 确定 最 佳 洗 脱 期 时 长 ， 并 在 此 基 
础 上 进行 后 续 分 析 研 究 。 
行政 管理 数据 (如 医保 数据 、 注 册 数 据 等 作为 宝贵 的 数据 资源 ， 涵 盖 范 围 广 ， 年 份 跨度 大 ， 获 取 
便捷 ， 相 对 于 传统 的 调查 有 一 定 的 优势 。 中 国 自 2012 年 改革 医保 制度 ”以 来 ， 大 力 推广 医保 政策 ， 扩 
大 涵盖 人 和 群 范围 ， 至 今 已 超 10 年 ， 有 效 数据 积累 年 份 逐渐 丰富 。 目前 在 万 方 、 知 网 、 维普 检索 的 利用 医 
保 、 医 院 注册 数据 等 行政 管理 数据 进行 流行 病 相关 分 析 的 文章 仅 21 篇 ， 远 少 于 行政 管理 数据 完备 ， 研 究 
范式 成 熟 的 其 他 国家 或 地 区 ， 说 明 中 国 在 此 方 的 应 用 仍 处 于 探索 阶段 ， 未 来 发 展 潜力 巨大 。 同时 ， 中 
国 在 使 用 医保 数据 库 进 行 分 析 时 ， 洗 脱 期 的 概念 尚未 得 到 重视 ， 检 索 到 的 21 篇 文献 均 未 使 用 洗 脱 期 ， 同 
样 ， 也 未 有 文献 聚焦 于 利用 中 国人 群 医疗 保险 数据 进行 疾病 流行 病 学 特征 分 析 时 洗 脱 期 时 长 的 研究 。 因 
此 ， 本 此 研究 系统 总 结 了 三 种 洗 脱 期 确定 的 方法 ， 为 后 续 研 究 者 利用 中 国医 保 数 据 ， 准 确 识别 中 国人 群 
慢性 疾病 新 发 病例 ， 探 究 疾病 流行 病 学 特征 提供 相关 思路 和 方法 支持 。 
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